[논문] 캔들스틱 차트와 합성곱 신경망을 이용한 주가 갭 예측 연구
원문: https://www.kais99.org/jkais/journal/Vol24No01/vol24no01p64.pdf
CNN 모형에 학습시킨 점과 단기거래에서 중요한 역할을 하는 주가 갭을 예측
캔들스틱 차트(candlestick chart) 패턴과 딥러닝 모형을 결합하여 주가의 갭(gap)을 예측하는 것이다.
합성곱 신경망(CNN : Convolutional Neural Network, 이하 CNN)을 이용하여 2차원의 이
미지 데이터를 학습하고 주가 갭을 예측한다.
첫째, 2017년 1월부터 2022년 8월까지의 기간에서 KOSPI200을 구성하는
개별종목의 일중 주가 자료와 KOSPI, S&P500,
NASDAQ 지수의 일별 자료로 이미지를 생성하고, 이미
지에 갭 수익률을 라벨링(labeling) 한다.
둘째, 갭 상승과 갭 하락을 예측하는 이진 분류 CNN
모형을 설계하고 이미지를 모형에 학습시킨 후, 모형의
성능을 평가할 것이다.
셋째, 학습, 검증, 테스트에 이용되지 않은 표본 외 자
료를 예측하여 결과를 평가하고, 예측 결괏값으로 롱숏전략(long-short strategy, L-S)을 시뮬레이션하여 실제
투자에서의 활용 가능성을 살펴볼 것이다
2. 이론적 배경
Lee et al.(1997)은 주식가격의 변동을 예고하는 패턴들을 정의하고 이를 이용해 차
트해석기(chart interpreter)를 개발하였다[6].
1992년 부터 1997년까지 데이터를 이용하여 패턴 매매 방식을 시뮬레이션한 결과 평균 투자 성공률이 72%를 보였지만, 사용자가 패턴을 정의해주어야 한다는 부분에 한계가
있다고 밝혔다. 이후 패턴을 이용한 분석은 Lee(2012)의 이동평균선 패턴과 전환점 행렬을 이용한 연구, Yang et al.(2019)의 M&W 패턴과 유전자 알고리즘을 이용한 연
구처럼 지능형 매매시스템을 이용한 연구로 발전하였다[7,8].
주가 갭
주가 갭은 거래가 중단되는 전일의 장 마감 시점부터 당일 장 시
작 시점까지 거래가 중단되는 시간 동안 새로운 정보가 발생한다면 당일 시가는 전일 종가와 차이가 발생할 수있다.
주가 갭 식(1)
$$
\text{gap}_t = {\text{Open}t \over \text{Close}{t-1}} - 1
$$
주가 갭 이례 현상(price gap anomaly) 연구
- Cross(1973)는 금요일과 월요일 사이에 주가 수익률 분포가 변함을 밝혔으며[9]
- French(1980), Gibbons and Hess(1981), Keim and Stambaugh (1984) 등에 의해 주말효과(weekend effect)가 연구되었다[10-12].
- 주가 갭에 관한 다른 연구로는 시가가 형성될 때 주가가 과잉반응하고 장중에는 과잉반응이 해소된다 주장하는 과잉반응가설(overreaction hypothesis)이 있다. Grant
et al.(2005)은 시가에 뚜렷한 양의 수익률이 나타나고 이후 장중에는 수익률이 반전한다고 분석했다[13]. - Ham et al.(2022)은 미국 주식시장에서 야간수익률이 주간수익률 보다 높은 오버나잇 퍼즐(overnight puzzle) 현상이 나타남을 밝혔다[14]
- Kim(2022)은 이 현상을 코스피 주가지수에 적용하여 실증 분석한 결과, 2003년 2월부터 2022년 6월까지의 기간에서 야간수익률의 평균이 하루 전체 수익률의 평균보다 4.08배 이상 높게 나타난다 분석했다[15].
합성곱 신경망과 주가 예측
CNN은 LeCun et al.(1989)이 문자인식을 위해 소개한 방법으로, 픽셀로 변환한 이미지의 특징을 추출하여 분류(classification)하는 것에 강점이 있는 딥러닝 모형
이다[16]LSTM(long shortterm memory) 등을 이용한 시계열 예측 연구와 함께 국내외에서 활발히 연구되고 있다[17].
Jiang et al.(2020), CNN과 이미지를 이용한 예측 성능 좋고, 일간 자료로 학습한 모형은 월간 자료를 예측하는 데 유용하며, 미국 주식에서 학습한 패턴은 국제 시장에서도 예측력이 높음을 보여주었다[18].
Sim et al.(2020)은 S&P500 지수에 9개의 기술적
지표(technical indicator)를 적용 후 이미지로 변환시켜
학습한 결과 CNN이 ANN(artificial neural network)
이나 SVM(support vector machine)보다 정확도가
높음을 밝혔다. 그리고 이 연구에서는 CNN에 사용되는
하이퍼파라미터(hyperparameter)를 최적화하여 변수
가 결괏값에 미치는 영향을 비교하였다[19].
3. 자료 및 연구 모형
[논문] 캔들스틱 차트와 합성곱 신경망을 이용한 주가 갭 예측 연구